查看原文
其他

【独家采访】王亮:深度学习引领AI新潮流

2015-04-21 姚响 思想坦克


【编者按】

《超能陆战队》中霸气而暖人的大白给人留下了深刻的印象,它就是一款能够学习的人工智能机器人。而如果您稍微关注下科技前沿,就会了解到谷歌、百度等巨头的最强“黑科技”,正是人工智能和深度学习,大白或许真的会在不远的将来出现。

此次,我们深入探访了人工智能科研的桥头堡­——中国科学院自动化研究所,拜访了该所模式识别国家重点实验室副主任王亮博士。相比于公司财报上炒得火热的“人工智能”和“深度学习”概念,是时候去伪存真,退一退虚火,让顶尖的科研工作者来为我们诠释下,到底什么是模式识别和人工智能?


人物简介


王亮:中科院自动化所研究员、博士生导师,模式识别国家重点识别实验室副主任、CCF计算机视觉专业组秘书长、图像视频大数据产业技术创新战略联盟秘书长。研究领域为模式识别、计算机视觉、机器学习、数据挖掘等。中科院“百人计划”入选者,IEEE 高级会员、IAPR Fellow。





Question:姚响(思想坦克智媒体记者)


Answer:王亮博士



模式识别就是要让机器“开眼看世界”


百度研究院(IDL)副院长余凯曾言,感知、思考和控制是人工智能最重要的环节。而模式识别就是要让机器开眼看世界,而且还要弄懂看到的是什么。那具体而言,模式识别到底有多重要呢?


Q:模式识别是人工智能学科的重要分支,请问到底什么是模式识别?

A:模式就是描述大千物理世界的本质属性。这些本质属性对应的可能是一些实体目标,例如椅子,也可能是一些抽象概念,例如意识行为。模式(pattern)识别的关键在于描述,即表达实体目标或抽象概念的属性特点,然后通过特定的方法进行分析和识别。比如,人脸识别是一 41 36435 41 14989 0 0 3359 0 0:00:10 0:00:04 0:00:06 3359典型的模式识别研究问题,主要用于身份识别。


QIntelIDF大会上展示了其炫酷的“刷脸技术”,那是不是意味着人脸识别技术已经成熟?

A:在模式识别研究中,至少我通常不会讲哪项成果已是成熟的,因为那意味着这项技术在任何条件下都可以得到很好的运用。事实上,香港中文大学汤晓鸥教授的团队,在LFW(编者注:业内用于评估非受限环境下人脸识别技术的权威数据库)上测试的成功率很高,已经接近100%了。但我们并不能说人脸识别已经成熟,因为在实际应用情景中,我们需要考虑数据样本采集的性质和难易程度对结果的影响。比如在ATM前的人脸识别,采集的人脸图像会受到光照、姿势、视角、帽子及遮挡物等因素影响,识别精度会有较大波动。尽管“刷脸技术”在一些场景中的运用看似很成熟,但仍还有完善的空间。


Q:除了人脸识别和指纹,还有其他常见的模式识别应用吗?

A:除了基于图像识别的生物特征识别,还有很多其他应用。人类怎样认识世界,就会对机器模式识别提出相应的要求——去看、去听、去思维。去看:包含机器视觉、图像视频识别与处理等;去听:包括语音识别、自然语言处理等,语音识别是我们最常见的模式识别应用了,科大讯飞在中文语音识别方面做得很好。去思维:包括知识的表示与推理,目前知识表示已有了一定的进展,知识推理还需要实质性的突破,推动机器思维的重点可能在于对脑结构和功能的更深入了解。这可能与人工智能最初的目标有着渊源,即试图让机器拥有类似于人类的智力能力和行为特性,让机器像人类那样去思考、推理、决策。




深度学习成为AI学界主导者


在人工智能的发展过程中,基于对“智能”的不同理解发展出了不同的学派,GOFAI(出色的老式人工智能)就是早期的主流学派。但这条进路遭遇了一些瓶颈和质疑,继而引发了第一次人工智能的“寒冬”。而目前,深度学习(联结主义)成为了AI学界的主导者。


QGOFAI比较擅长逻辑推理,曾是人工智能学界的主流。后来为什么深度学习取而代之成为新的学科范式?

AGOFAIAI界符号主义的别称。GOFAI认为知识是可以用符号来表示的,所以智能就是逻辑推理、信息加工的一个过程,这个过程可以采取一些形式化的语言来描述,比如说启发式的知识或者启发式的搜索,用形式化语言来解决逻辑推理问题。GOFAI的冷落个人认为有几方面原因:1、有限的符号难以描述无穷的知识类别,尤其是大数据时代的知识爆炸;2、形式化语言要定义一些语法规则,但随着知识的增长,语法规则相应加大,让机器去学习语法规则和人为定义语法规则都很困难。深度学习是2006HintonScience发表文章后开始兴起的,但深度学习本身不是一个新方法,它实际上仍是神经网络,只不过是层数更多了。它的突然回暖也与计算机的计算能力相关,主要包括利用大数据来训练模型和高性能计算的普及。深度学习的本质功能在于表达学习,并且突破了传统利用先验来手工设计特征的模式,转而进行数据驱动的自主特征学习。不同于以往的单一低层特征,自主特征学习可以获得具有层次性的、由低层到高层的特征,具有更强的表示能力。


Q:人工智能的发展历程特别曲折,经历过热潮也碰到过低谷,那为何现在的人工智能又再一次成为社会热点?

A:科技和商业都经历高高低低的过程,很多时候会遇到瓶颈问题。比如前一段时间大家不提人工智能,直到深度学习概念广为人知,人工智能才又被推到“风口”之上。深度学习对人工智能中的基础问题,即知识的表示提供了一个有效的方法。事实上,知识表示是很多人工智能任务的瓶颈,提供有效的知识表示直接推动了人工智能领域的发展。(如Nature2015一篇文章:计算机学会如何去玩游戏)。


Q:深度学习的局限性是什么?

A:任何技术可能都有其局限性。深度学习目前只是对感知机的一个简单扩展,它远远没有实现对人脑的功能和结构的模拟,人类大脑肯定要比深度神经网络复杂的多。首先,深度学习不能“有选择性地主动”获取知识,现有系统一般是在任务指导下,人为地给网络“挑选”数据,让它在挑选好的数据上去训练学习知识;其次,现有深度学习需要大量的数据进行有监督或者无监督的训练,而不是像人一样,仅需要少数样本就能很好地获取知识;最后,深度学习现有的成功案例大多是处理静态数据,而实际上,我们处在一个快速变化的环境里,对时序、动态变化的数据建模和分析更加重要。虽然深度学习有以上局限,但随着相关学科的发展,特别是脑科学、神经科学、计算心理学等的重大突破,我相信在未来若干年里,深度学习在理论和应用方面会有更大的发展。




人工智能研究将形成“竞合关系”


谷歌和百度等巨头都有各自的人工智能研究院,欧洲与美国都发展了自己的“大脑计划”,各方势力展开了新一轮的科技竞赛。但另一方面,京东与科大讯飞达成了战略合作,各方在竞争的同时又有着合作的趋势。


Q:京东与科大讯飞达成了战略合作,深度学习是一个庞大项目,AI研究有没有可能成为基因测序那样的全球性项目?

A:如果能够成为全球共同合作项目的话,自然是我们的美好愿望。但AI涉及的领域很多——在自然科学方面会涉及到计算机、生物学、神经学、信息论等;在社会科学方面会涉及到社会学、心理学、哲学等。但事实上我们并不像了解基因一样了解人工智能,人们对智能的了解非常少,还处于百家争鸣、百家齐放的时代,并没有一个统一的认识。目前,各个国家和地区仍是分别行动,比如欧盟的大脑计划(HBP)、美国大脑计划,但侧重点都不太一样。美国的大脑计划更多的是神经认知学家在推动,侧重研究人脑机理等,偏生物学和医学;而欧洲大脑计划计算机学家和工程学科学家参与的更多,他们主张借鉴人脑的一些机理,去制造类人脑的机器。


Q:李彦宏提出“中国大脑”的新曼哈顿计划,将AI上升至国家战略高度,政府在AI研究中能起到什么样的作用?能提供什么样的便利和资源?

A:我个人认为李彦宏提出“中国大脑”计划,上升到国家高度是很有必要的。但调动全社会的力量去做这个事情可能是不现实的,也没有这个紧迫性。政府最好能扮演组织者、协调者这样的角色。提出提案是好的,但我们不能盲目乐观、激进行动。有些人以为5-10年人工智能就会发展到不可想象的地步,其实没有那么快。我们应积极推动人工智能发展,但同时要保持清醒头脑。



人工智能的商业化是福是祸


科技与商业是密不可分的“孪生子”,尤其是伴随二十世纪以来实用主义哲学的流行,也伴随科研成本的加大,脱离商业的科研貌似只有死路一条。那对于人工智能这样一门“形而上学”色彩浓厚的学科,商业化是福是祸?


Q:目前AI学界似乎不太关注如何让机器拥有人类思维,具有强烈的实用主义和商业化倾向,请问您怎么看?

A:目前的人工智能也不一定是研究人员所期望的人工智能,但做任何事情都要考虑社会需求。科技与商业相辅相成,有需求才会去进行技术开发,否则就没有研究意义。技术与商业应有机结合,通过技术解决某一需求后,又会产生新的技术需求,这是一个相互促进的过程。人工智能归根到底是为了学习人脑的智能去解决实际问题。我们研究人员自然希望机器变得聪明,将来能代替人从事一些高危险性的、力所不及的、枯燥乏味的工作。如果过于商业化,会偏离我们研究人员的初衷。AI是研究人产生智能的本质规律,这是一个科学探索的问题,并在科学探索的基础上,开发一些对社会有用的、具备人类智力的智能系统和机器,完成只有人类智力才能完成的工作。


Q:您认为智能手环、智能灯泡等智能硬件,能称得上“智能化”吗?

A:智能硬件是融入了某种智能元素的硬件产品。智能硬件和智能化是两个不同的问题,不同的概念,并非包含与被包含的关系。功能实用、体验优良的硬件产品也许就可以称为智能硬件;而体验不好,没有数据分析、趋势提醒、决策建议等的产品则不能。智能化可以推动智能硬件的发展,智能硬件也反过来对智能化提出了更高的要求。


Q:智能硬件是在砸智能化的招牌吗?

A:我们希望研究的成果是有应用的,比如做一个融入研究成果的设备,来方便人们的行为习惯或方式。事实上,智能硬件是体现智能化实用价值的一个出口。


Q:您怎样看待智能硬件当前不温不火的状态?

A:有些厂商为了商业目的,可能会过分商业化、过分实用主义,打着智能化的旗号,其实所做的产品远非真正的智能化,是过度宣传的表现。智能硬件想要长远发展,还要从社会需求入手,不能为了智能而智能。


Q:我们看到,从科技到企业再到产业,人工智能和智能化已形成一个链条和闭环。这是否意味着,智能化浪潮是不是真的来了?

A:智能化趋向越来越明显,人类文明进化史上经历了多次工业革命。工业革命、电气革命、科技革命、工业4.0的物理信息融合系统等。身边的产品越来越智能化,并以移动互联网、智能交互为途径,融入了生活的方方面面。现代社会高度自动化、信息化后,会慢慢推进智能化的进程。人工智能被炒得火热,绝不是竹篮打水一场空。一方面是大势所趋,另一方面是技术到了爆发期。计算机视觉数据以前都不具有高鲁棒性(编者注:鲁棒性就是系统的健壮性。它是在异常和危险情况下系统生存的关键。比如说,计算机软件在输入错误、磁盘故障、网络过载或有意攻击情况下,能否不死机、不崩溃,就是该软件的鲁棒性),而现在计算机视觉技术正越来越完善。类似地,人工智能的研究与实用正并行发展、突飞猛进。


Q:请您用几个词概括下智能化浪潮的特点。

A:我想该是高度自动化、高度信息化、高度智能化、高度网络互联化。



“奇点临近”之说有点为时尚早


自从2005年雷﹒库兹韦尔《奇点临近》一书出版以来,计算机具备人类思考能力,强人工智能实现,超级智能爆炸,人类与机器的边界逐渐消弭等未来学理论甚嚣尘上。作为客观理性的科学家,王亮博士认为:人工智能还在起步阶段,“AI灭世”的观点也太悲观!


Q:强人工智能会不会在不久的将来出现?

A:以发展眼光来看还是有可能性的。现在更多的是弱人工智能。强人工智能的概念应该是能够制造出一种机器,具有思考推理的功能或者解决问题的能力,当然这种机器可能是有感知能力的;弱人工智能针对的通常是某一特定任务,如图像识别是模拟人的视觉,这只是智能的一个方面。而强人工智能要把所有的功能组合起来,会牵扯到许多子任务,若现在子任务都做不好,怎么达到强人工智能?简单的组合并非1+1=2那样的逻辑。功能组合起来可能是多功能的,但不一定是智能化的。尽管现在有类脑计划去模拟大脑的机理,但大脑本身就是黑匣子,所以这是一件很难的事情。前段时间大家都在探讨人工智能是否到了奇点,我认为奇点的到来为时尚早。AI可以说还处于起步阶段,但从长远发展来看,强人工智能也是有可能的,技术总是在发展的,以前许多我们认为不可能的事情也都发生了。另外,我们人对智能的理解尚不透彻,我们人也是在不断进化的,在不同的发展阶段智能的定义可能也是变化的。


Q:可能100年内,强人工智能都不会到来,但我认为弱人工智能同样能改变世界。大众可能对于AI 的直接了解源于电影,其实他们并不清楚人工智能到底是什么。比如推荐算法也是一种人工智能,但大家可能认为它是计算机或工程学的应用,不把它看作是一种AI。我对弱人工智能比较乐观。

A:我赞同你的看法,而且弱人工智能已经在社会经济的许多方面有了大规模的应用。比如语音识别,在AI中只是一个小的分支,但也成就颇丰。再比如智能家居,我不想用遥控器我就说:“换25频道”,机器识别就自动给你换台了。这在将来会方便更多人、满足多种应用场景的需求。弱人工智能重点解决某些特定的任务,而每一任务在生活中可能都是非常重要的。


Q:您如何看待“AI灭世”的悲观论调?

A:我个人不同意“AI灭世”这种观点,有点太悲观,远达不到那种程度。现在是模拟人脑功能,但远没有达到意识的地步。机器人没有意识的话,将很难具有情感;意识与物质有关,比如人的意识与神经物质有关。我个人认为机器拥有意识的可能性非常非常小。不过,人类在设计机器的过程中应该考虑,如果机器有危害人类的可能性,就应该设计相应的灾难预防机制。



——采写/姚响(思想坦克智媒体记者)




声明:本文由思想坦克智媒体独家采访撰写,请转载者注明来源及作者名字。




■关注有奖

凡扫描关注思想坦克智媒体微信公号的读者,都将获得下述之一的奖励:1、参加思想坦克举办的沙龙1次(除北京以外,我们已经或即将在全国各地建设智能基地);2、获得思想坦克赠送的图书或礼品。

请关注后,在后台输入您的姓名、公司及职务、手机号码等资料发给我们,我们很快就会和您取得联系。多谢!

简单一句话:凡加微,留痕迹,必约你!!

长按下列二维码,选择识别加入——



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存